AI资讯新闻榜单内容搜索- DeepSeek-

视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

通过针对视觉的细分类、目标检测等任务设计对应的规则奖励，Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知，为视觉语言模型的训练开辟了全新路径！

来自主题: AI技术研报

8097 点击 2025-03-04 20:09

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

GRPO（Group Relative Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法》。

来自主题: AI技术研报

10033 点击 2025-03-02 15:14

500万TPM+20msTPOT，火山引擎用「AI云原生」重构大模型部署范式

部署 DeepSeek 系列模型，尤其是推理模型 DeepSeek-R1，已经成为一股不可忽视的潮流。

来自主题: AI资讯

7856 点击 2025-02-26 14:22

一文详解：DeepSeek 第三天开源的 DeepGEMM

DeepSeek 开源周的第三天，带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型（MoE）计算，为 DeepSeek-V3/R1 的训练和推理提供强大支持，在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。

来自主题: AI技术研报

8551 点击 2025-02-26 10:46

从o1-mini到DeepSeek-R1，万字长文带你读懂推理模型的历史与技术

自 OpenAI 发布 o1-mini 模型以来，推理模型就一直是 AI 社区的热门话题，而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。

来自主题: AI技术研报

9660 点击 2025-02-24 14:40

DeepSeek引发鲶鱼效应，中国算力市场呈现“四变”

这个AI领域千亿级市场，将辐射千家万户。 DeepSeek-R1横空出世，打响了大模型比拼性价比的第一枪。 Meta、OpenAI等国外头部大模型厂商纷纷复刻或变相降价。比DeepSeek-R1晚两周发布的OpenAI o3-mini模型，定价比前代模型o1-mini降低了超6成，比前代完整版的o1模型便宜超9成。

来自主题: AI资讯

10359 点击 2025-02-19 09:38